攻击大型语言模型

学习识别和利用大型语言模型漏洞，涵盖提示注入、不安全输出处理和模型投毒。

在本模块中，我们将介绍针对使用大型语言模型的系统的实际攻击，包括提示注入、不安全输出处理和模型投毒。您将学习精心设计的输入和模型输出的粗心处理如何暴露机密或触发未经授权的操作，以及被投毒的训练数据如何导致持续性故障。每个主题都包含动手练习和真实场景，展示小问题如何连接成更大的攻击路径。最终，参与者能够构建简洁的概念验证攻击，并提出清晰、实用的缓解措施。